#RTX GPU | 熱門關鍵字 | 鉅亨號 | Anue鉅亨

#RTX GPU

牙膏踩爆！RTX 6090可能會有2.9萬個CUDA核心但還得漲價

NVIDIA前兩天發佈了Rubin CPX，這是一款針對AI推理而生的GPU，沒用昂貴的HBM，而是給了128GB GDDR7視訊記憶體。這款CPX顯示卡對遊戲玩家而言也不是沒意義的，因為它很可能是未來的RTX 6090顯示卡基礎，網友High Yield稱CPX顯示卡沒有像其他AI專用卡那樣閹割了光柵單元，而是保留了下來。考慮到NVIDIA在復用GPU上刀法精妙，這意味著CPX所用的GPU核心未來也是Rubin家族遊戲卡的核心，即便規格不完全一樣，但也會非常相似。具體來說的，RTX 6090顯示卡所用的核心可能是GR202，SM單元數量從當前的170組提升到224組，CUDA核心來到了28672個，將近2.9萬核心了，也是史無前例的。這將使其FP32性能從RTX 5090的104.77TFLOPS提升到143.36TFLOPS，大約提升30%以上，這還沒考慮到架構上的提升。視訊記憶體規格方面可能變化不大，畢竟RTX 5090已經做到了32GB 512bit，NVIDIA也不太可能良心到一下子給64GB視訊記憶體，不過受益於GDDR7頻率提升，頻寬從1.8TB/s提升到1.92TB/s，聊勝於無吧。以上是對RTX 6090顯示卡的推測，個人覺得算是挺靠譜的，但是最終如何還得看NVIDIA在那裡下刀，整體性能提升30%也符合這兩年來的發展軌跡。不過伴隨著RTX 6090規格的提升，下代顯示卡又來一波漲價也是可以預期的，畢竟Rubin會使用台積電3nm工藝，比當前RTX 5090的4N（本質還是5nm改進）工藝貴不少，再加上其他改進，性能與價格漲幅估計也是正相關的。奇怪的是，RTX 5090/5080 FE公版開始消失了。NVIDIA Founders Edition是很多玩家心目中的信仰所在，但公版卡起的是一個帶頭作用，理論上不應該和AIC廠商搶生意，AMD的公版卡就幾乎不怎麼賣，NVIDIA這邊的公版卡壽命已經夠長了。最近在歐美市場，RTX 5090、RTX 5080的公版卡開始悄無聲息地消失，NVIDIA官網紛紛下架了，美國、法國、德國、英國等主要國家均是如此。比如在德國，NVIDIA官網上已經看不到RTX 5090 FE，而在英國和美國，RTX 5090、RTX 5080 FE都被移除了，最高只有RTX 5070。目前還不清楚這是臨時調整，抑或NVIDIA已經停產。NVIDIA德國的一位發言人在接受採訪時只是說，不清楚。NVIDIA中國官網上，RTX 5090 FE自然是沒有的，RTX 5080 FE倒是依然在列，可以跳轉到京東、天貓旗艦店，而價格一直堅持8299元不動搖。英國德國法國美國另外，SK海力士官方宣佈，全球第一家完成了新一代HBM4記憶體的研發，並且已經做好了大規模量產的準備。SK海力士HBM4記憶體的I/O介面位寬為2048-bit，每個針腳頻寬10Gbps，因此單獨一顆的頻寬就可高達驚人的2.5TB/s。這已經超過了JEDEC標準規範中規定的8Gbps，SK海力士宣稱在AI裝置中部署後可帶來最多69％的性能提升。SK海力士還使用了該公司自研的MR-MUF封裝技術，1bnm工藝也就是第五代10nm級。至於satck堆疊層數、單顆容量，SK海力士暫未披露，預計最高12堆疊。另外，三星也在積極推進HBM4，希望能和SK海力士搶一杯羹。HBM4記憶體對於下一代AI基礎設施至關重要，NVIDIA、AMD、Intel都離不開它。其中，NVIDIA Rubin預計搭載288GB HBM4，AMD Instinct MI400系列更是最高做到恐怖的432GB，頻寬19.6TB/s。除了遊戲卡市場，AMD還在AI顯示卡市場追趕NVIDIA的步伐，這個領域要比遊戲市場更難，甚至很難靠性價比優勢賣出銷量。AMD近期多位高管的表態都在強調2026年的MI450系列AI顯示卡將會給AMD帶來重磅收入，而且性能等方面全面超越對手產品。但是今年的AI市場上，AMD主打的MI350系列可能就沒那麼受歡迎了，HSBC匯豐銀行日前發佈的報告中，將AMD的目標價從200美元下調到了185美元。下調的原因就是MI355顯示卡的均價從25000美元降至23000美元，約合人民幣16.4萬元。該系列顯示卡是今年初才發佈的，3nm工藝，CDNA4架構，其中MI350X適用於風冷，MI355X適用於液冷，兩者的規格差不多，都是288GB HBM3e視訊記憶體，8TB/s頻寬，後者的性能更高一些。MI355X的FP64性能可達78.6TFLOPS，FP16、FP8及FP4性能則是5、10.1、20.1PFLOPS。這樣規格的顯示卡平均售價只要16萬元出頭，這是什麼概念呢？NVIDIA基於RTX 4090改進的國內特供顯示卡H20，也就96GB HBM3記憶體，之前國內售價都超過了20萬元，被哄搶的時候甚至更高。在AMD PPT中性能比B200還要強的MI350系列顯示卡，還要得打價格戰，這也能說明NVIDIA在AI市場護城河有多深，不單是AMD硬體性能領先就能比的。不過匯豐也在報告中表示，儘管下調了目標股價，但AMD在AI市場上的前景還是不錯的，明年預期收入也只是從151億調至139億美元，仍比預期高20%，華爾街低估了AMD的AI業務。包括微軟、甲骨文、Meta在內的雲服務廠商也在加強與AMD的合作，測試他們的MI400系列機櫃解決方案，這是AMD明年在AI市場翻身的殺手鐧級產品。 (硬體世界)

The Information：輝達H20，清完庫存為止？輝達重啟生產面臨障礙

根據《The Information》周六（19 日）報導，美國晶片巨頭輝達( NVDA-US ) 已告知中國客戶，其H20 人工智慧（AI）晶片供應量有限。 H20 為目前美國允許輝達對中國出口的最高階AI 晶片。報導引述兩位知情人士指出，美國政府於4 月下令禁止H20 晶片出口至中國，使輝達被迫取消原先的客戶訂單，並撤銷在晶片代工大廠台積電( 2330-TW ) 的製造產能預約。輝達執行長黃仁勳於北京一場媒體活動上表示，台積電已將原定的H20 生產線轉為供應其他客戶的晶片產品。若從零開始重新製造H20 晶片，可能需要耗時九個月。報導指出，輝達目前並未計畫恢復H20 晶片生產，但沒有引用任何消息來源或提供細節。輝達也拒絕對該報導發表評論。儘管遭遇禁令與產能問題，黃仁勳近期仍釋出樂觀訊號，表示輝達將加速H20 晶片供應，並對美國政府核發對中出口許可一事持正面態度，預計相關申請將能順利獲批。輝達本周正式表示，將恢復向中國銷售H20 晶片，但依據現行美國出口政策，仍需事前取得授權許可。此外，為強化對中國市場的佈局，輝達也宣佈正在開發一款新晶片RTX Pro GPU，該產品將完全符合美國對中國的出口規範。路透社隨後引述兩名知情人士稱，中國多家企業正加緊提交訂單。輝達收到訂單後，需將其提交美國政府審批，目前字節跳動和騰訊正準備提交申請。知情人士透露，輝達已建立一個“白名單”系統，讓有意購買的中國企業登記，此舉是申請流程中的關鍵環節。不過，字節跳動不具名負責人星期三（16日）向第一財經表示，目前並未提出購買申請，有關報導不精準。眾議院特別委員會的共和黨籍主席穆勒納爾星期五（19日）致函美國商務部長盧特尼克說：“商務部此前禁止輸出H20的決定是正確的，我們不能讓CN使用美國晶片訓練AI模型，強化它的軍事能力、以及削弱美國的創新力。” (invest wallstreet)

輝達家用級“超級電腦”內建RTX 5070級顯示卡，能打遊戲嗎？

在台北電腦展上，輝達介紹了家用級“超級電腦”DGX Spark 的最新消息。此前，在三月份的 GTC 活動中，輝達正式發佈了為AI愛好者和家庭開發者打造的迷你桌上型電腦DGX Spark，但沒透露內部GPU的詳細規格。現在，我們知道，這款超級電腦搭載的處理器在技術上與RTX 5070十分類似。GPU內部細節曝光據Videocardz報導，DGX Spark內部改採用的GB10晶片擁有6144個CUDA核心，與RTX 5070一致。然而，儘管兩款GPU都基於輝達的Blackwell架構，但GB10不是用來打遊戲的，所以，視訊記憶體頻寬僅有273GB/s，相較於RTX 5070的672 GB/s顯得遜色許多。統一記憶體架構與能效表現與傳統的獨立視訊記憶體設計不同，DGX Spark 配備了128 GB的LPDDR5x統一記憶體，這套記憶體不僅供給Blackwell GPU使用，同時也為Grace CPU 提供運算支援。相比之下，RTX 5070僅搭載了12 GB的GDDR7視訊記憶體。這一記憶體配置對於 AI訓練和大規模資料處理來說，非常有用。此外，一位對微星提出疑問的網友透露，這款超級電腦的GPU 功耗上限為224 W，而RTX 5070 的TGP為300 W，這表明GB10的運行頻率可能被適當壓低以控制功耗。輝達方面表示，GB10在峰值性能又1000 AI TOPS，而RTX 5070則為 988 TOPS。雖然這兩個數字可能只是理論值，但也顯示出DGX Spark在 AI運算方面的強大潛力。定位與市場前景儘管DGX Spark採用了與RTX 5070類似的GPU，一般使用者沒法拿它打遊戲。畢竟，該裝置運行的是定製的輝達作業系統，主要面向AI演算法開發與訓練市場。不過，這也給駭客和改裝愛好者留下了無限遐想：或許不久的將來，會有技術極客嘗試將這台超級電腦改造成一款迷你遊戲主機。目前，關於 DGX Spark的定價尚無明確公開資訊，但早前預訂價約為 4000美元。對於那些熱衷於AI訓練，並希望以較低成本建構類似性能配置的使用者來說，128 GB的統一記憶體無疑提供了難以抗拒的吸引力，因為組建一台配置相似的自研系統所需的成本可能更高。 (科技巴圖魯)

輝達RTX Pro 6000 Blackwell GPU發佈：性能與記憶體大幅提升！

輝達新一代工作站GPU——RTX Pro 6000 Blackwell的規格近日曝光，顯示出其在性能和記憶體容量上的顯著提升。根據LeadTek網站的洩露資訊以及NBD貨運記錄，RTX Pro 6000 Blackwell GPU擁有24,064個CUDA核心，配備96GB GDDR7視訊記憶體，功耗為600W，相比前代RTX 5090 GPU，CUDA核心數量增加了11%。此次曝光的RTX Pro 6000 Blackwell GPU是輝達在RTX 6000 Ada發佈兩年多後的下一代產品。從命名上看，輝達為下一代工作站卡引入了新的“Pro”標籤，旗艦產品仍屬於“RTX 6000”系列，但增加了“X”識別碼。儘管輝達的工作站產品命名法一直不夠統一，但此次的“Pro”標籤似乎暗示了更高的性能定位。根據洩露的規格資訊，RTX Pro 6000 Blackwell系列包括兩個版本：RTX Pro 6000 X Blackwell和RTX Pro 6000 Blackwell。兩款GPU均配備96GB GDDR7視訊記憶體，採用512位記憶體介面，視訊記憶體由多個24Gb（3GB）晶片組成，兩個晶片共享一個32位記憶體控製器。非“X”版本的RTX Pro 6000 Blackwell擁有188個流處理器（SM），相當於24,064個CUDA核心，佔GB202晶片的97.9%。而主銷的RTX Pro 6000 X Blackwell則採用GB202-870晶片，預計將啟用所有192個SM。 RTX Pro 6000 Blackwell的功耗為600W，是RTX 6000 Ada所需功耗的兩倍多，但可以通過一根12V-2x6電源線滿足供電需求。這一高功耗設計表明，該GPU旨在滿足專業應用的高性能需求，尤其是在人工智慧訓練和推理、遊戲開發、內容創作、專業可視化（ProViz）和電腦輔助設計（CAD）等領域。儘管96GB的視訊記憶體容量對於大多數遊戲場景而言可能過剩，但在上述專業應用中，大容量視訊記憶體將提供顯著優勢。

【CES 2025】老黃重磅發佈5090，定價15000！22000元的世界最小AI超級電腦也來了

就在剛剛，老黃穿著全新的皮衣，在CES上一波接一波放大招。先是發佈了自家最新的GPU——RTX 5090。直接來看下基於Blackwell架構的最新GPU主要性能：擁有920億個電晶體

【輝達GTC大會】輝達引爆AI PC革命！ RTX GPU給 1億打工人送算力 40系卡秒生百張圖畫質爆表

【導讀】如今炙手可熱的AI PC之戰，輝達也下場了！ RTX GPU給1億打工人加持的算力，已經破了紀錄，生圖、視頻、會議、直播，統統被RTX AI史詩級升級；《黑神話：悟空》《永劫無間》的玩家，更是雙廚狂喜！昨天深夜，輝達CEO黃仁勳甩出能訓萬億參數大模型的新核彈B200，直接打破了摩爾定律。同時推出的AI推理微服務NIM，號稱能讓全世界用上AI。同時，輝達又為1億RTX PC用戶和開發者，更新了AI應用和工具，直接要讓我們快轉到AI PC時代：

輝達中國特供版RTX 5880發表！性能比旗艦大砍近25%，比RTX 5000只高6%

【導讀】英偉達（輝達）公佈國區特供版專業級顯示卡RTX 5880 Ada，性能大砍接近25%，價格未知。去年年底，英偉達正式發布了「減量不減價」的中國特供版消費級旗艦顯示卡－RTX 4090 D。就在剛剛，英偉達又曝光了面向專業領域的RTX 5880 Ada！相較於旗艦級RTX 6000，定製版5880在性能方面可謂是大幅降級－CUDA核心少了23%，單精度浮點性能低了24%。

輝達H100，沒那麼缺貨了！RTX 4090 ，大漲！

可以肯定的是，在接下來的幾個月裡，使用Nvidia GPU 的長隊可能會變得更短。過去幾個月，許多大大小小的公司都報告收到了數千塊H100 GPU。這樣，在雲端使用H100 GPU 的排隊時間可能會縮短。資料中心供應商和前比特幣挖礦公司正在開設具有H100 叢集的資料中心。這些公司承諾以大型雲端供應商成本的一小部分提供H100 GPU 運算，而大型雲端供應商則對H100 GPU 加速的虛擬機器收取高價。亞馬遜最近宣布，將在其網站上對H100 GPU 進行1 至14 天的預訂，以應對未來需求的激增。